AI Infra(4 篇)

📚 MiniMind 笔记:大模型从零实现的完整路径

MiniMind 系列笔记目录——从 Tokenizer、Embedding 等基石,到 Transformer 架构、MoE、KV Cache,再到 SFT、DPO、PPO 算法的完整学习路径

·3 min read·499
# LLM# MiniMind# Transformer

🖥️ 基石:关于 Tokenizer 你所需要知道的一切

从 BPE、WordPiece、Unigram 的算法对比,到 GPT-2 / GPT-4 分词器的工程演进,再到 Tokenizer 对大模型能力边界的深远影响

·16 min read·3123
# LLM# Tokenizer# BPE# MiniMind

🥋 从零理解 AI Infra

从零建立对 AI Infra 领域的全景认知:硬件层、系统软件层、训练系统、推理系统与性能工程。

·15 min read·2820
# AI Infra# CUDA# 分布式训练# 推理优化# GPU

AI Infra 学习路线

从前置基础到推理部署,系统梳理 AI Infra 的完整学习路线——每个模块含知识点、推荐资料与可量化检验标准。

·16 min read·3160
# AI Infra# CUDA# 分布式训练# 推理优化# 学习路线